ทำความเข้าใจภาพรวมของ “Amazon CloudWatch” กุญแจสำคัญในการตรวจสอบ AWS

ทำความเข้าใจภาพรวมของ “Amazon CloudWatch” กุญแจสำคัญในการตรวจสอบ AWS

นี่เป็นบทความที่มีเนื้อหาดัดแปลงมาจากบทความภาษาญี่ปุ่นของ Classmethod, Inc. ในหัวข้อ AWS監視の要となる「Amazon CloudWatch」全体像を把握する หากผู้อ่านสนใจอ่านเนื้อหาต้นฉบับสามารถอ่านได้ที่ลิ้งค์ "บทความต้นฉบับ" ด้านล่าง เนื้อหาในบทความนี้มีการอัพเดทเนื้อหาบางอย่างเพื่อให้เข้าใจง่ายขึ้นทำให้แตกต่างจากต้นฉบับในบางจุด

ประโยชน์ที่สำคัญของ AWS คือคุณสามารถไว้วางใจ AWS ในการจัดการการตรวจสอบหลายๆส่วนที่สำคัญที่เราเคยตรวจสอบใน On-Premises แต่ก็ไม่ได้หมายความว่าเราไม่จำเป็นต้องตรวจสอบทั้งหมดเองด้วย สิ่งที่สำคัญคือคุณควรตรวจสอบ ติดตาม และรักษา environment ให้เหมาะสมกับสถานะของระบบที่ทำงานบน AWS ตรวจสอบให้แน่ใจว่าไม่มีส่วนใดบน AWS environment ของคุณที่มี workload สูง หรือ สิ้นเปลืองทรัพยากร

Amazon CloudWatch เป็นบริการที่มีบทบาทสำคัญในการตรวจสอบ AWS environment เหล่านี้ แต่ถึงแม้จะมีฟังก์ชันการทำงานมากมาย แต่บางครั้งคุณอาจรู้สึกเป็นเรื่องยาก เช่น "ไม่รู้วิธีใช้งาน"

ในบทความนี้จะมาแนะนำฟังก์ชันหลักของ Amazon CloudWatch และอธิบายพื้นฐานก่อนเพื่อให้คุณเข้าใจภาพรวมได้

สารบัญ
★Amazon CloudWatchคืออะไร
★สิ่งที่ Amazon CloudWatch ทำได้ 3 อย่าง
★หากคุณใช้ AWS เราขอแนะนำให้ใช้ Amazon CloudWatch ด้วย

Amazon CloudWatchคืออะไร

Amazon CloudWatch เป็นบริการตรวจสอบที่ให้บริการโดย AWS ซึ่งรวบรวมค่าวัดที่เกี่ยวข้องกับ resources ต่างๆบน AWS Cloud และ performance ของแอปพลิเคชันที่ทำงานบน AWS โดยค่าวัดที่รวบรวมสามารถแสดงภาพและตรวจสอบได้แบบเรียลไทม์ และสามารถแจ้งเตือนเมื่อตรวจพบความผิดปกติ นอกเหนือจากรายการ standard เช่น อัตราการใช้งาน CPU แล้ว ยังรองรับรายการที่เรากำหนดเองได้อีกด้วยซึ่งจะช่วยให้ตรวจสอบได้อย่างยืดหยุ่นเพื่อให้เหมาะกับ environment และการใช้งานของบริษัทของคุณ

ด้วยการวิเคราะห์สถานะการใช้งาน resources บน AWS ด้วย Amazon CloudWatch และปรับเปลี่ยนเพื่อให้แน่ใจว่าไม่มีส่วนเกินหรือข้อบกพร่อง ไม่เพียงแต่ปรับปรุงประสิทธิภาพการใช้งานเท่านั้น คุณยังสามารถปรับค่าบริการการใช้งานให้เหมาะสมอีกด้วย

สิ่งที่ Amazon CloudWatch ทำได้ 3 อย่าง

การรวบรวม

Amazon CloudWatch รวบรวม "ตัวเลข" และ "log" ที่เกี่ยวข้องกับ resource และบริการของ AWS รวมถึงแอปพลิเคชันที่สร้างขึ้นเพิ่มเติม AWS มีการเก็บรวบรวมพวกค่าวัดที่สำคัญต่างๆโดยอัตโนมัติ เช่น การใช้งาน CPU ปริมาณการโอนถ่ายเน็ตเวิร์ค และให้บริการตัวชี้วัดประสิทธิภาพมาตรฐานของ performance เหล่านี้โดยไม่คิดค่าใช้จ่ายเพิ่ม
นอกจากนี้ยังสามารถรวบรวม log ต่างๆ ตั้งแต่ OS ไปจนถึงมิดเดิลแวร์และแอปพลิเคชัน และ log เหล่านี้จะเป็นประโยชน์ในการตรวจสอบสาเหตุของ error บนระบบ ด้วยการระบุเป้าหมายและเวลาที่เกิดขึ้นโดยใช้หน่วย metric ที่ระบุ error และตรวจสอบ log ในส่วนที่เกี่ยวข้อง คุณจะสามารถระบุสาเหตุ เช่น "หน่วยความจำไม่เพียงพอ" จาก error log ได้อย่างมีประสิทธิภาพ

มอนิเตอร์ริ่ง

ฟังก์ชันที่สำคัญที่สุดของ Amazon CloudWatch คือมอนิเตอร์ริ่ง ซึ่งจะตรวจสอบ metric และ log ต่างที่รวบรวมไว้ และจัดให้มีการแจ้งเตือน (Amazon CloudWatch alarms) และการแสดงภาพ (CloudWatch Dashboard) คุณสามารถตรวจสอบแดชบอร์ดที่สรุปค่าต่างๆ ได้อย่างง่ายดายในหน้า AWS Management Console สำหรับแต่ละบริการ เช่น Amazon EC2 และ Amazon RDS นอกจากนี้ยังสามารถตั้งค่าเตือนเคสที่ต้องการ response เช่น "การใช้งาน CPU เกิน...%" หรือ "ดาวน์โหลด log ของ error ที่เฉพาะเจาะจง" และยังสามารถตั้งค่าให้การแจ้งเตือนส่งไปที่อีเมลหรือช่องทางอื่นๆได้

อย่างไรก็ตาม ไม่ใช่ความผิดปกติทั้งหมดที่สามารถกำหนดเป็นตัวเลขได้ มีเคสที่จำเป็นต้องรวมหลายรายการเข้าด้วยกันเพื่อพิจารณาว่ามีความผิดปกติอยู่หรือไม่ ดังนั้นหากคุณสร้างแดชบอร์ดที่กำหนดเอง ($2/เดือน) สำหรับตัวชี้วัดที่มีการอ้างอิงบ่อยครั้ง จะทำให้คุณสามารถดูความสัมพันธ์ระหว่าง resource ได้อย่างง่ายดาย ตัวอย่างเช่น โดยการแสดงข้อมูลที่สัมพันธ์กัน เช่น จำนวน request และโหลดของเซิร์ฟเวอร์ คุณจะสามารถดูข้อมูลต่างๆ เช่น "จำนวน request เพิ่มขึ้นแต่การใช้งาน CPU ของเซิร์ฟเวอร์มีเสถียรภาพที่ประมาณ 50% ดังนั้นจึงไม่มีปัญหา" หรือ "เซิร์ฟเวอร์ปรับขนาดอัตโนมัติและสามารถจัดการกับจำนวน request ที่เพิ่มขึ้นได้"

ตัวอย่างของ Dashboard
137849c03192473a35063a81c27194bb

แน่นอนว่านอกเหนือจากการเพิ่มขึ้นของ workload แล้ว คุณยังสามารถทราบถึงสถานะของการใช้งานในปัจจุบันและทำให้คุณใช้งานบริการต่างๆได้อย่างเหมาะสมตามสถานการณ์ปัจจุบัน เช่น "ลดสเปค EC2 เมื่อพบว่าสเป็คเซิร์ฟเวอร์สูงเกินไปสำหรับจำนวน request (การใช้งาน CPU ต่ำฯลฯ)"

การวิเคราะห์

แม้ว่าจะสามารถตรวจสอบข้อมูลที่รวบรวมโดย CloudWatch ได้เลย คุณยังสามารถประมวลผลและวิเคราะห์ข้อมูลเพิ่มเติมโดยใช้ค่าทางสถิติในช่วงเวลาที่คุณกำหนดได้อีกด้วย นอกเหนือจากค่าเฉลี่ย ค่าสูงสุด ค่าต่ำสุด และค่าทั้งหมดแล้ว ยังรองรับเปอร์เซ็นไทล์ (ตำแหน่งสัมพัทธ์ของค่าในชุดข้อมูล) ค่าเฉลี่ยแบบตัด (ค่าเฉลี่ยของค่าระหว่างขอบเขตที่ระบุสองขอบเขต)

คุณสามารถใช้ CloudWatch Dashboard เพื่อค้นหาค่าเฉลี่ยหรือค่าสูงสุดของค่าตัวเลขที่ได้รับสำหรับหนึ่งรายการ และยังสามารถตรวจจับค่าที่ผิดปกติโดยใช้ Machine Learning และประมวลผลตัววัดหลายตัวโดยใช้สูตรการคำนวณ (CloudWatch Metric Math)

นอกจากนี้ยังมี CloudWatch Logs Insight ที่ใช้ในการวิเคราะห์ log อีกด้วย โดยที่จะบันทึก log ต่างๆ เช่น จำนวน Output ที่เกิด error, แยก string ที่มี specific error code หรือ error message และดำเนินการด้วย SQL Query นอกจากนี้ยังสามารถมอนิเตอร์ค่าตัวเลขที่ได้จาก CloudWatch Logs Insight เช่น จำนวนครั้งและความถี่ โดยการ customize บน CloudWatch

หากคุณใช้ AWS เราขอแนะนำให้ใช้ Amazon CloudWatch ด้วย

หากคุณใช้ AWS เราขอแนะนำอย่างยิ่งให้ตรวจสอบข้อมูลที่สำคัญด้วย Amazon CloudWatch กล่าวได้ว่า Amazon CloudWatch เป็นฟังก์ชันที่สำคัญเทียบเท่ากับมาตรวัดรถยนต์และเครื่องบันทึกการขับขี่ต่างๆซึ่งได้รับการพัฒนามากขึ้นในช่วงไม่กี่ปีที่ผ่านมา แม้ว่าจะมีปัญหาบางอย่างเกิดขึ้นบน AWS แต่ด้วย Amazon CloudWatch คุณจะสามารถทราบได้ว่า "เกิดอะไรขึ้น ที่ไหน เมื่อไหร่" ที่สามารถใช้เพื่อแก้ไขปัญหาหรือได้รับการซัพพอร์ทได้

ในแต่ละวันคุณสามารถใช้ Amazon CloudWatch เพื่อตรวจสอบสถานะของระบบที่ทำงานบน AWS และดำเนินการแก้ไขตามความจำเป็นเพื่อให้บรรลุการใช้งานที่เหมาะสมยิ่งขึ้น ในด้านราคา AWS เป็นแบบจ่ายตามการใช้งานเพราะฉะนั้นคุณจะจ่ายเฉพาะส่วนที่คุณใช้เท่านั้น ดังนั้นการทำความเข้าใจสถานะการใช้งานและการกำจัดทรัพยากรที่สูญเปล่าจะนำไปสู่การเพิ่มประสิทธิภาพต้นทุน เมื่อคุณเริ่มใช้ AWS ให้ฝึกนิสัยในการตรวจสอบโดยใช้ Amazon CloudWatch

บทความที่เกี่ยวข้องกับ Amazon CloudWatch

AWS CloudWatch คืออะไร? การแนะนำฟังก์ชันของ AWS CloudWatch ในปี 2023 (Thai)
แนะนำการใช้งาน Dashboard ใน CloudWatch และตรวจสอบว่าสามารถทำอะไรได้บ้าง (Thai)
การสร้าง CloudWatch Log เพื่อใช้งานใน EC2 บน AWS (Thai)
[AWS Technical Support Note] วิธีทดสอบ CloudWatch Alarm ที่กำหนดค่าไว้ (Thai)
การเพิ่ม Monitoring ของ EC2 Instance ไปยัง CloudWatch Dashboard (Thai)
อัพเดทบริการ Amazon CloudWatch Synthetics ในปี 2024 (Thai)

บทความต้นฉบับ

AWS監視の要となる「Amazon CloudWatch」全体像を把握する (Japanese)

この記事をシェアする

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.